package com.zzyl.common.utils.pdf;

import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.text.PDFTextStripper;

import java.io.IOException;
import java.io.InputStream;

/**
 * PDF解析工具类
 * 使用Apache PDFBox库解析PDF文件内容
 */
public class PDFParser {

    /**
     * 从PDF文件中提取所有文本内容
     *
     * @param inputStream PDF文件的输入流
     * @return 提取的文本内容
     * @throws IOException 如果读取或解析PDF时发生错误
     */
    public static String extractText(InputStream inputStream) throws IOException {
        try (PDDocument document = PDDocument.load(inputStream)) {
            PDFTextStripper stripper = new PDFTextStripper();
            return stripper.getText(document);
        }
    }


}